Für Interessierte: Hier erklären wir Ihnen was die Punktzahlen an den Metadaten bedeuten.
Über die Metadatenqualität
Wie und warum wird auf umwelt.info Metadatenqualität bestimmt?
Auf umwelt.info findet sich zu den Metadaten jedes Inhaltes eine Qualitätsbewertung. Diese richtet sich zum einen an die Ersteller der Inhalte, da Metadaten wichtig sind um Inhalte schnell und gezielt zu finden. Zum anderen richtet sich die Bewertung an Dateninteressierte, um zu zeigen ob ein gefundener Inhalt bestimmte Merkmale erfüllt. Punkte wie:
- eine einfache Nachnutzbarkeit durch Verwendung offener Lizenzen,
- ein offenes Dateiformat, oder
- die Möglichkeit, den Inhalt als Datensatz automatisiert herunterzuladen, sind oft wichtige Kriterien für eine Suche und werden hier übersichtlich dargestellt.
Die Bestimmung der Metadatenqualität orientiert sich an den vier FAIR-Prinzipien: Findable (Auffindbar), Accessible (Zugänglich), Interoperable (Interoperabel) und Reusable (Wiederverwendbar). Mehr zu den vier FAIR Prinzipien findet sich hier. Eine Übersicht über die Qualitätsbewertung findet sich in Tabelle 1. Die Einzelmerkmale schwanken entweder binär (gleichbedeutend mit Ja oder Nein), schrittweise (gleichbedeutend mit z.B. unspezifisch zu sehr spezifisch) oder kontinuierlich. Diese Übersicht ist auch als Factsheet herunterladbar (siehe unten).
FAIR-Prinzip | Kriterium | Bewertungssystem | Bedeutung |
---|---|---|---|
Auffindbar | Kennung | Ja oder nein | Besitzt der Inhalt eine eindeutige Kennung? |
Titel | Kontinuierlich | Wie gut ist die Lesbarkeit des Titels? | |
Beschreibung | Kontinuierlich | Wie gut ist die Lesbarkeit der Beschreibung? | |
Schlagwörter | Kontinuierlich | Wie gut stimmen die Schlagwörter mit dem Umweltthesaurus überein? | |
Raumbezug | Keine Region, Allgemeine Region, Koordinatenbereich, Genaue Region, Punktkoordinate | Wie präzise ist der Ortsbezug? | |
Zeitbezug | Ja oder nein | Ist ein Zeitbezug vorhanden? | |
Zugänglich | Verweis | Noch nicht auf umwelt.info implementiert. | |
Direktzugriff | Ja oder nein | Ist ein Link zum Inhalt vorhanden? | |
Öffentlich | Ja oder nein | Ist der Link ohne Anmeldung nutzbar? | |
Interoperabel | Maschinenlesbare Daten | Ja oder nein | Ist der Datensatz automatisiert auslesbar? |
Maschinenlesbare Metadaten | Ja oder nein | Sind die Metadaten automatisiert auslesbar? | |
Medientyp | Ja oder nein | Ist das Dateiformat des Datensatzes bekannt? | |
Offenes Dateiforma | Ja oder nein | Ist das Dateiformat des Datensatzes offen (z.B. .CSV)? | |
Wiederverwendbar | Lizenz | Keine Information, unklare Lizenz, Spezifische Lizenz, spezifische & offene Lizenz | Ist die Lizenz bekannt und frei? |
Kontakt | Ja oder nein | Sind Kontaktinformationen vorhanden? | |
Veröffentlicher*in | Ja oder nein | Ist der*die Herausgeber*in bekannt? |
Beispiel 1
Zur Veranschaulichung kann die Qualitätsbewertung eines Beispieltreffers zu einer Grundwassermessstelle dienen (siehe Abbildung 1). Die Auffindbarkeit hat in diesem Fall eine Punktzahl von 67. Da der Inhalt keine eindeutige Kennung hat, ist dieser Wert Null. Titel und Beschreibung haben 41 bzw. 82 Punkte was eine mittlere bzw. hohe Lesbarkeit gemäß des von uns verwendeten Lesbarkeitsindexes hat. Schlagwörter hat 80 Punkte, da vier der fünf vorhandenen Schlagwörter sich im Umweltthesaurus finden. Sowohl Raumbezug als auch Zeitbezug haben 100 Punkte, da sowohl die exakten Geodaten der Messtelle, sowie der Zeitraum der Messungen bekannt ist. Die Zugänglichkeit liegt bei 100 Punkten, da ein Direktzugriff auf den Inhalt per Link möglich ist und dieser öffentlich zugänglich ist. Die Interoperabilität liegt bei 75 Punkten, da drei der vier Einzelmerkmale voll zu treffen. Maschinenlesbare Daten werden für die Messstelle im CSV-Format angeboten, maschinenlesbare Metadaten hingegen keine. Der Medientyp ist bekannt (da ein CSV-Format verwendet wird) und es handelt sich um eine offenes Dateiformat. Die Wiederverwendbarkeit liegt bei 67 Punkten, da zwei der drei Einzelmerkmale voll zu treffen. Es wird eine bekannte, offene Lizenz verwendet (100 Punkte), es sind keine Informationen zum Kontakt vorhanden (Null Punkte) und der Herausgeber ist bekannt (100 Punkte).
Beispiel 2
Um die Funktionenweise der stufenweise definierten Einzelmerkmale besser zu veranschaulichen, kann ein weiterer Beispieltreffer, diesmal von einer Schadstoffbestimmung in Tieren aus dem Pfälzerwald, dienen (siehe Abbildung 2). Im Gegensatz zum Beispiel in Abbildung 1 erzielt das Merkmal Raumbezug hier nur 50 Punkte, da nur ein größeres Gebiet (Pfälzerwald) und keine genauen Geodaten vorliegen. Auch die Lizenz hat nur 33 Punkte, da für den Inhalt zwar eine Lizenz angegeben ist, es sich jedoch nicht um eine bekannte Lizenz handelt. Ein bekannte aber unfreie Lizenz würde hierbei 66 Punkte erzielen, während das Fehlen einer Lizenzangabe mit 0 Punkten bewertet wird.